| r21 | ||
|---|---|---|
| r1 (새 문서) | 1 | [목차] |
| 2 | == 개요 == | |
| 3 | LSM/ADC 서버 BS 작업 시 참고 할만한 체크리스트를 작성 하였다. | |
| 4 | ||
| r15 | 5 | == 작업 중 장애 트러블 슈팅 == |
| r18 | 6 | 서버 부팅이 정상적으로 안되는 내용은 [[서버 행업 시 트러블 슈팅|행업 트러블 슈팅]] 관련 문서 확인 |
| r19 | 7 | |
| r20 | 8 | === LSM/ADC 관련 작업 중 발생했던 장애 === |
| 9 | '''1. 이중화 기동 및 프로세스, VIP 충돌 현상''' | |
| 10 | * '''현상''': ADC 서버가 재부팅 된 후 Active 권한을 스스로 가져가 버리거나, 기존 LSM 서버도 Active 상태인 경우다. 이로 인해 두 서버에서 동일한 [[VIP]](Virtual IP)와 프로세스가 동시에 구동되어 IP 충돌 및 서비스 장애가 발생한다. | |
| 11 | * '''해결''': | |
| 12 | 1. '''프로세스 정리''': 작업 전 백업해 둔 프로세스 정보 리스트를 활용해 ADC가 Active 상태일 떄 가지고 있어야 하는 프로세스를 할당한다. | |
| 13 | 2. '''VIP 해제''': ADC 서버가 VIP를 정상 점유 중인지 확인 후, LSM 서버에 올라와 있는 중복 VIP를 인터페이스 다운 명령어[* 예: ifconfig bond0:1 down 또는 환경에 맞는 명령어를 사용한다.]를 통해 비활성화하여 '''Active-Standby''' 상태로 정상화한다. | |
| r15 | 14 | |
| 15 | == LSM/ADC 서비스 실행 프로세스 및 포트 정보 == | |
| 16 | ||<tablealign=left><tablewidth=400><tablebordercolor=#cccccc><-2> '''프로세스 및 포트 정보''' || | |
| 17 | ||<width=70%> '''프로세스 명''' ||<width=30%> '''포트 번호''' || | |
| 18 | || LFMServer || 8549 || | |
| 19 | || LFMSinkModule || 8550 || | |
| 20 | || [[LoadBalancer2|LoadBalancer2]] || 50890 || | |
| 21 | || ADSController || 904 || | |
| 22 | || ADSClient || 911 || | |
| r21 | 23 | || [[L_ADS|L_ADS]] || 30000 || |
| r11 | 24 | || L_GSDM || 18079 || |
| 25 | || L_NRM || 18081 || | |
| r6 | 26 | || file_requester || 18084 || |
| 27 | || cache_manager || 8081 || | |
| r14 | 28 | || NetIOServer3 || 32128 || |
| r6 | 29 | || CiMonitoringAgent || 30002 || |
| 30 | || [[CiGLBServer|CiGLBServer]] || 확인 후 추가 || | |
| 31 | ||
| 32 | ||
| 33 | == LSM/ADC BS 작업 체크리스트 == | |
| 34 | ||<tablewidth=100%> 순서 / 체크 항목 || 명령어 || 기준 값 || 결과 || | |
| 35 | ||<|2> 사전 || 서버 공통 체크리스트 점검 || [[서버 공통 체크리스트|서버 공통 체크 리스트]] || 부팅 전 상태 확인을 위한 점검 || || | |
| 36 | || [[GTV 서버 점검 스크립트|서버 점검 스크립트]] || ./Server_Check.sh 7 LSM or ADC || 모든 항목이 이상없음 상태입니다. 문구 출력 시 정상 || || | |
| 37 | ||<|12> 부팅 후 || 시스템 로그 확인 || tail -F /var/log/messages[br]egrep -i "error|fail" /var/log/messages || Error/Fail 로그 없을 시 정상 || || | |
| r14 | 38 | || 서버 공통 체크리스트 점검 || [[서버 공통 체크리스트|서버 공통 체크 리스트]] || 부팅 후 상태 확인을 위한 점검 || || |
| r6 | 39 | || 백업 환경 비교 || diff [사전 백업 파일] [현재 상태] || 부팅 전 백업한 파일과 상태가 동일할 시 정상 || || |
| 40 | || LoadBalancer 로그 확인 || tail -F /var/log/castis/lb_log/EventLog_*.log[br]egrep -i "error|fail" /var/log/castis/lb_log/* || "Selected for Client StreamID" 로그가 계속 출력 될 경우 정상 || || | |
| r12 | 41 | || CiGLBServer 로그 확인 || egrep -i "error|fail" /var/log/castis/glb_log/* || "Successfully New Setup Session" 로그가 지속적으로 출력 될 경우 정상 || || |
| 42 | || LFMServer 로그 확인 || tail -F /var/log/castis/lfm_log/* || 배포 성공(6)이 계속 출력 될 경우 정상 [*1 6: 배포 성공, 5: 부분 성공, 4: 배포 실패 ] || || | |
| 43 | || ADS 로그 확인 || tail -F /var/log/castis/adc_log/* || “[MovieFile::SyncByteCheck] PASSED” 확인 [br] PackLoss가 50% 미만인지 확인 || || | |
| 44 | || L_GSDM 로그 확인 || tail -F /var/log/castis/gsdm/*_gsdm.log || "success to alloc" 로그가 지속적으로 출력 시 정상 || || | |
| 45 | || 동적배포 실패 건수 || egrep -i "error|fail" /var/log/castis/gsdm/* || 3개 이상 시 중앙서버 통신 상태 점검 || || | |
| 46 | || 큐톤 파일 요청 개수 || cat [GLB_LOG] | grep 'p=c1' | grep RequestFullFileName -c || 요청수와 응답수를 비교하여 검증 || || | |
| 47 | || [[GTV 서버 점검 스크립트|서버 점검 스크립트]] || ./Server_Check.sh 7 LSM or ADC || 모든 항목이 이상없음 상태입니다. 문구 출력 시 정상 || || | |
| 48 | || 세션 할당 확인 || lbstat || 대역폭/세션 정상 수치 및 증가 확인 [*예시 Ex) [br] vod40199 Running 2.1139G / 15G [14%] 276 / 3750 [7%] 27.6387T / 30.7235T [89%] [br] vod40200 Running 2.17629G / 15G [14%] 299 / 3750 [7%] 27.6381T / 30.7235T [89%] ] || || |